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基于 改进 引力 搜索 算法 的 K-means 聚 类 
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摘 要 : 针对 K-means 算法 的 聚 类 结果 极 易 受到 聚 类 中 心 的 影响 而 陷入 局 部 最 优 解 的 问题 ， 提 出 一 种 基于 改进 引力 搜 
索 的 KK-means 聚 类 算法 。 首 先 引 入 自 适应 概念 ， 对 引力 系数 衰减 因子 进行 控制 ， 提 高 算法 的 全 局 探索 能 力 和 局 部 开发 
能 力 ; 然后 ， 引 入 免疫 克隆 选择 机 制 ， 以 便 算 法 能 够 有 效 跳出 局 部 最 优 ， 并 通过 对 12 个 基准 测试 函数 的 实验 验证 改进 
引力 搜索 算法 的 有 效 性 和 优越 性 ; 最 后 ， 通 过 结合 改进 的 引力 搜索 算法 和 K-means 算法 ， 提 出 一 种 新 的 聚 类 算法 
A2F-GSA-Kmeans， 并 在 6 个 测试 数据 集 上 的 实验 表明 ， 该 算法 具有 较 好 的 聚 类 质量 。 
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Novel K-means clustering algorithm based on improved gravitational search algorithm 


~ Wei Kangyuan* ®t, He Qing* ?i, Xu Qinshuai*? 
和 (a. College of Big Data & Information Engineering, b. Guizhou Provincial Key Laboratory of Public Big Data Guizhou 
University, Guiyang 550025, China) 


Abstract: In order to solve the problem that the clustering result of K-means algorithm gets affected by the initial cluster 
centers easily, this paper proposed a novel K-means clustering algorithm based on improved gravitational search algorithm. 
Firstly, it enhanced the global exploration and local exploitation capability of the algorithm with the introduction of adaptive 
concept to control the attenuation factor of gravitational constant. Then, by introducing immune clonal selection algorithm to 
make the algorithm jump out of the local optimum efficiently. The experimental results on twelve test functions prove the 
effectiveness and superiority of the improved GSA. Finally, by combining the improved GSA with K-means algorithm, this 


paper proposed a new clustering algorithm called A2F-GSA-Kmeans. The experimental results on six test datasets show that 


the algorithm has better clustering quality. 
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学 者 应 用 到 聚 类 问题 中 ， 来 弥补 传统 聚 类 算法 的 缺陷 。 例 如 杨 

菊 晴 等 ”59 通过 对 蝙蝠 优化 算法 (BA) 的 位 置 和 速度 更 

聚 类 是 分 析 数 据 的 重要 方法 ， 其 作用 是 将 多 个 抽象 对 象 按 。” 新 方式 进行 优化 ， 同 时 引入 非 线性 惯性 权重 和 limit 阔 值 思想 ， 

照相 应 的 标准 分 成 由 相似 的 对 象 组 成 的 多 个 类 过 程 ， 已 经 被 ) 提高 了 算法 的 收敛 性 能 ， 并 将 改进 算法 与 K-means 结合 ， 提 出 

泛 应 用 于 许多 领域 ,其 中 K-means 算法 在 处 理 大 量 数据 时 具有 了 一 种 基于 改进 BA 算法 的 K-means 算法 ， 取 得 了 较 好 的 聚 类 

简单 高 效 的 优点 ， 已 经 被 广泛 应 用 ， 但 其 聚 类 结果 极 易 受 到 聚 ”效果 于 佐 军 等 人 ”Ag 通过 引入 算术 交叉 操作 改进 人 工 

类 中 心 的 影响 ， 导 致 陷入 局 部 最 优 解 ** 9 ， 并 且 要 求 用 蜂 群 算法 中 引领 蜂 和 跟随 蜂 的 搜索 模式 , 并 结合 K-means 算法 ， 
户 指定 聚 类 数量 , 然而 不 同 的 聚 类 数 将 会 得 到 不 同 的 聚 类 结果 ， ”提出 一 种 聚 类 算法 来 自动 寻找 最 优 的 聚 类 数 。 


0 引言 


直接 影响 算法 的 效率 。 因 此 ， 算 法 本 身 可 以 获得 最 优 数目 的 聚 引力 搜索 算法 :被 和 RE (Gravitational Search Algorithms， 
类 是 非常 重要 的 。 GSA) 是 Esmat Rashedi 教授 等 于 2009 年 提出 的 一 种 新 的 群 智 
群 智能 算法 因 其 强大 的 全 局 搜索 能 力 ， 已 经 被 越 来 越 多 的 能 优化 算法 ， 该 算法 通过 模拟 物理 学 中 万 有 引力 来 搜索 全 局 最 
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优 解 。 研 究 发 现 ， 在 对 基准 测试 函数 进行 优化 时 ， 经 典 GSA 
算法 的 优化 精度 与 收敛 速度 均 明 显 优 于 粒子 群 优化 算法 


魏 康 园 ， 等 : 基于 


1 K-means 陈 类 篆 


对 于 欧 氏 距离 的 数据 ， 本 文 使 


GhinaX aXiv 合 作 期 和 
进 引力 搜索 算法 的 作 期 means TD 


法 流程 图 
均 方 误差 MSE 作为 聚 类 


(particle swarm optimization，PSO ) 和 遗传 算法 (genetic 的 目标 函数 ， 且 MSE 的 值 越 小 表示 聚 类 效果 越 好 。 定 义 为 

en GA) 等 优化 算法 各 和 9 eg 与 其 他 元 启发 MsE=1 5 ly -zl (1) 

式 算法 类 似 , 经 典 GSA 算法 同样 存在 早熟 收敛 、 易 陷入 局 部 极 et 

值 等 缺陷 ， 基 于 此 ， 近 年 来 国内 外 学 者 实现 了 许多 有 效 的 改进 ” 其 中 ，z 表示 聚 类 中 心 。 

GSA 算法 , 如 Liu 等 全 种 9 利用 混沌 映射 优化 GSA 算法 本 文 使 用 轮廓 系数 和 fs 来 评价 不 同 聚 类 数 下 的 聚 类 

中 粒子 的 位 置 初始 化 ， 同 时 将 自 适 应 递减 惯性 权重 系数 引入 到 质量， 从 而 找 出 最 佳 的 聚 类 数 。 对 于 每 个 聚 类 的 轮廓 系数 的 表 

位 置 更 新 公式 中 ， 提 出 并 实现 了 AC-GSA 算法 ， 并 在 经 典 基 ; 示 为 

测试 函数 的 测试 和 优化 最 小 二 乘 支 持 向 量 机 超 参数 上 都 取得 ] 1 b(m) — a(m) 0) 

良好 的 结果 ，Sun 等 人 9 用 泊 , 基于 粒子 个 体 的 异 质 性 ， 利 ft max{blm), alm)} 

用 粒子 个 体 最 优 值 和 全 局 最 优 值 对 GSA 算法 的 Kbest 和 速度 更 。 其 中 : ;表示 每 个 聚 类 中 样本 个 数 ，alm) 表示 样本 m 与 同类 

新 方式 进行 改进 ， 提 出 了 LIGSA 算法 ， 使 得 粒子 能 够 学 习 K 其 他 样本 的 平均 距离 ，b(m) 表示 样本 m 与 其 他 聚 类 中 所 有 样本 

个 近邻 粒子 而 充分 开发 搜索 空间 并 有 效 防止 早熟 收敛 ， 同 时 全 ”平均 距离 的 最 小 值 。 

局 最 优 值 的 引导 可 加 速算 法 收敛 速度 Mirjalili 等 人生 不 局 ， 对 于 整个 数据 集 ， 则 可 通过 平均 轮廓 指标 来 评价 聚 类 结果 

基于 GSA 算法 中 引力 系数 G 对 于 平衡 算法 全 局 探索 能 力 与 局 。” 的 有 效 性 ， 表 示 如 下 : 

部 开发 能 力 的 重要 性 ， 利 用 混沌 映射 对 引力 系数 进行 改进 ， sl L$ 区 

验证 了 其 能 够 跳出 局 部 最 优 实现 更 高 寻 优 精度 的 有 效 性 。 然 而 ， 心志 

尽管 已 有 研究 对 经 典 GSA 算法 的 寻 优 效果 有 所 提高 , 且 大 多 集 ”其 中 : ee 且 -l<ss<l， 若 吧 接 近 1 

中 于 结合 PSO oo GSA 算法 的 速度 和 位 置 更 新 方式 的 改进 和 时， 表示 am 和 远 小 于 5b(m) ， 即 聚 类 质量 效果 好 。 

交 ! 示 并 到 引用 浙 。8 错 闪 未 开 到 引用 汤 ，， 但 对 于 实现 算法 探索 与 开发 能 力 的 有 1.2 经 典 GSA 算法 

效 平衡 和 解决 其 早熟 收敛 问题 仍 需 深入 研究 。 引力 搜索 算法 (GSA) 是 将 空间 中 所 有 的 粒子 视 为 遵循 牛 
综 上 所 示 ， 本 文 针 对 引力 搜索 算法 易 陷入 局 部 最 优 、 发 生 ” 顿 第 三 定律 进行 无 阻力 运动 的 有 质量 的 物体 ， 质 量 越 大 的 物体 


早熟 收敛 现象 等 


问题 ， 


首先 对 引力 搜索 算法 中 的 引力 系数 作出 


改进 ， 保 留 算 法 较 高 精度 和 收敛 速度 的 同时 ， 提 高 算法 的 全 局 
条 索 能 力 和 局 部 最 优 能 力 ; 然后 再 引入 免疫 克隆 选择 机 制 ， 改 
善 算法 早熟 收敛 现象 ; 最 后 将 改进 的 GSA 算法 应 用 到 K-means 
聚 类 算法 中 ， 通 过 调节 K 值 大 小 ， 利 用 聚 类 评价 函数 来 获取 最 
佳 的 聚 类 数 。 

1 ”相关 工作 

1.1 K-means 算法 


K-means 算法 是 
机 选取 样本 空间 中 的 
样本 中 其 他 数据 点 与 
分 。 该 算法 的 流程 如 


种 基于 划分 的 聚 类 算法 ， 该 算法 首先 随 
K 个 数据 点 作为 聚 类 中 心 ， 然后 通过 计算 
中 心 点 的 欧式 距离 大 小 ， 来 对 数据 进行 划 
图 1 所 示 。 


输入 : 数据 集 N、 取 类 数 K | 
证 


随机 选取 K 个 样本 作为 初始 聚 类 中 心 


计算 每 个 样本 与 


各 个 聚 类 中 心 的 欧式 聚 类 ， 对 样本 进行 划分 


更 新 聚 类 中 心 


聚 类 中 心 是 否 变化 


输出 K 个 类 


将 占据 更 优 位 置 。 通 过 物体 间 相 互 万 有 引力 的 作用 ， 寻 到 最 优 
解 。 经 典 的 GSA 算法 流程 如 图 2 所 示 。 
开始 
随机 初始 化 


计算 适应 度 值 


更 新 best(}、worst() 和 (四 ， 其 中 j=7, 2 …, 


计算 每 个 方向 的 引力 、 加 速度 和 过 度 | 


更 新 每 个 粒子 的 位 置 、 适 应 度 值 和 全 局 最 优 值 


经 典 的 引 
种 群 ， 在 D 维 


力 搜 索 
搜索 空 


其 中 : 


式 为 


嫩 2 GSA 算法 流程 图 


述 如 


下 : 假设 由 VN 个 粒子 X; 构 成 的 


间 中 ， 定 义 第 ;个 粒子 的 位 置 为 


X, = (X!, XX?,, TE, 


XD),i=1,2,.,N (4) 


表示 第 i 个 粒子 在 第 k 维 
时 ， 粒 子 i 的 惯性 质量 MQ) 可 根据 其 适应 度 值 来 更 


fit, (1) — worst(t) 


mass, (1) = 1 best(t) — worst(t) 


1 


上 的 位 置 。 当 进行 第 1 次 迭代 


新 ， 更 新 公 


if best(t) # worst(t) 
(5) 


otherwise 
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mass, (1) 


MD = 
» mass; (人 (6) 


其 中 :所 CD) 表示 粒子 ;在 迭代 :时 的 适应 度 值 ，1=12…'N 。 对 


疫 克 隆 选 择机 制 的 改进 引力 搜 


factor based 


Gbinaxkjy 合 作 期 刊 


魏 康 园 ， 等 : 基于 改进 引力 搜索 


gravitational search algorithm, A2F-GSA) 。 


2.1 自 适应 引力 系数 非 线性 衰减 
在 GSA 算法 中 ， 万 有 引力 系数 G 对 于 寻找 算法 最 


于 求解 最 小 值 优化 问题 ， 最 优 适 应 度 ex() 和 最 差 适 应 度 
worst(t) 分 别 为 


best(?) = i fit,(t) (7) 


worst(1) = IDaX ， fi (7) (8) 


jcl1.2 


反之 ， 即 可 用 于 最 大 值 优 化 问题 。 
当 进 行 第 1 次 迭代 时 ， 定 义 粒子 i 和 粒子 i 在 第 k 维 的 相互 
吸引 力 为 


FD =G0 ONO (0) x 
i RO+e * (9) 


其 中 : M; 表示 作用 粒子 i 的 惯性 质量 ，M, 表示 被 作用 粒子 i 的 
惯性 质量 ; s 为 常量 ; en R,(D) 
表示 粒子 i 与 粒子 j 之 间 的 距离 (一般 取 欧 氏 聚 类 ) ， 计 算式 分 
别 为 


i (10) 


RD)=|X.0, X00,, (11) 


其 中 : 6G, 表示 宇宙 在 最 初时 刻 的 万 有 引力 常量 ; a 表示 引力 系 
数 的 衰减 因子 ， 一 般 取 值 为 常数 ，7 表示 最 大 和 迭代 次 数 。 
在 GSA 中 ， 设 第 :次 粒子 ;在 第 k 维 所 受 的 总 作用 力 为 


= ba rand, xF; (t) (12) 


j=1, jzi 


其 中 :rand 表示 [0,1 的 一 个 随机 数 ， 太 的 定义 如 式 (6) 所 示 ; 
Kpest 初始 值 为 N， 并 随 着 时 间 推 移 逐 渐 减 小 为 1， 定 义 为 


Kbest(t) = final _ per+ GD x(100— final _ per) (13) 


其 中 : ”final_per 表示 对 其 他 粒子 产生 作用 力 的 粒子 百分比 。 
依据 牛顿 第 二 定律 ， 当 进行 第 :次 迭代 时 ， 粒 子 : 在 第 上 维 
上 的 加 速度 可 定义 为 


FD) 


aD= 0 


(14) 


GSA 算法 每 一 次 迭代 进化 过 程 中 , 粒子 根据 下 式 更 新 粒子 
i 的 速度 v 和 位 置 *， 即 
V(t+D=rand, xv (t) +a lt) (15) 


Xt+D)=x D+v (t+1) (16) 
其 中 : rand, 表示 [0 的 一 个 随机 数 。 


2 改进 的 引力 搜索 算法 


本 文 针对 经 典 引力 搜索 算法 易 陷 入 局 部 最 优 解 、 发 生 早熟 
收敛 现象 等 问题 ， 提 出 一 种 基于 自 适 应 引力 系数 衰减 因子 和 免 


党 重要， 如 


式 〈7) 所 示 ， 其 中 主要 参数 为 和 < ， 且 通常 取 


值 为 一 个 常数 。 研 究 表明 ， 参 数 G, 通常 取 值 为 100 时 ， 算 法 能 
优化 效果 。 对 于 参数 4 ， 通 过 调整 其 取 
现 ， 在 算法 迭代 前 期 ， 参 数 “ 取 较 小 值 ， 能 够 保证 


够 取得 最 佳 
值 大 小 会 发 
粒子 增加 的 
后 期 ， 当 参 
局 部 开发 能 
数 & 对 算法 
化 的 引力 系 


K-means 聚 类 


索 算法 (adaptive attenuation 


解 非 


步 长 ， 提 高 算法 的 全 局 探索 能 力 ， 而 在 算法 欠 代 中 
数 & 取 值 较 大 时 ， 将 会 加 快 收敛 速度 ， 提 升 算法 的 
力 看 。。 通过 研究 指数 函数 的 特性 ， 结 合 参 


数 衰减 因子 ， 定 义 如 下 : 


lg(7x) 
Q(t)=yxe 7 


其 中 : 上 表示 当前 和 欠 代 次 数 ，7 表示 最 大 和 迭代 次 数 ， ”和 


为 “函数 的 


较 大 的 引力 


力 。 


本 文选 取 7y= 


参数 ,选择 合适 的 参数 的 来 控制 a 函数 的 变化 范围 ， 
100，7=01 。 自 适应 的 “ 在 算法 早期 迭代 时 生成 
系数 G ， 能 够 更 加 有 效 的 提升 全 局 探索 能 力 ， 
期 迭代 时 生成 较 小 的 引力 系数 G ， 能 够 有 效 提升 局 部 开发 能 


2.2 引入 免疫 克隆 选择 机 制 
析 经 典 GSA 算法 的 基本 原理 可 知 , 随 着 算法 的 友 代 
将 逐渐 聚集 于 群体 中 适应 度 较 优 的 粒子 ， 从 而 使 得 


通过 分 
进化 ， 粒 子 
粒子 分 布 收 


MAPCPSOI 


缩 ， 多 样 性 减 小 ， 导 致 算法 易 陷 入 局 部 最 优 。 
献 错误 ! 未 找到 引用 源 。 结 合 人 工蜂 群 算法 和 克隆 选择 算法 
(Clonal Selection Algorithm, CSA) 提 
献 错误 ! 未 找到 引用 源 。 基 于 粒子 群 算 法 及 CSA 算法 提出 的 
算法 启发 ， 本 文 在 经 典 GSA 算法 中 引入 免疫 克隆 


性 能 的 影响 ， 本 文 提出 一 种 基于 迭代 次 数 自 适应 变 


(17) 


7 分别 


在 后 


受 文 


出 的 DQABCI 算法 和 文 


选择 机 制 ,结合 GSA 算法 的 寻 优 能 力 和 CSA 算法 的 选择 复制 、 


变异 和 再 选 


善 算法 的 早 3 


克隆 选 


熟 收敛 现象 。 


择 算 法 (CSA ) 各 到. 由 De Castro 等 人 了 


择 的 特点 ， 使 得 算法 具有 跳出 局 部 最 优 的 能 力 ， 改 


年 提出 ,是 
其 以 构建 记 


错误 ! 未 找到 引用 源 。 


扩大 算法 寻 


种 基于 人 工 免疫 算法 内 部 微 演化 过 程 的 优化 算法 。 


六 2000 


忆 单 位 为 基础 ， 实 现 全 局 探索 与 局 部 开发 能 力 平衡 


， 并 由 单个 最 优 个 体 演化 为 群体 最 优 解 集 ， 能 够 在 
包 区 域 的 同时 , 体现 免疫 系统 的 多 样 性 。 


CSA 算法 主要 包括 克隆 复制 、 克 隆 变 异 和 克隆 选择 三 个 


其 中 克隆 复 


变异 阶段 / 
选择 阶段 / 


文中 引入 的 


] 于 在 新 建 种 群 中 选取 适应 度 (亲和力) 高 的 
入 下 一 代 , 在 实现 种 群 压缩 的 同时 ， 


制 阶段 用 于 实现 种 群 规模 及 寻 优 空间 的 扩张 ; 
于 增加 种 群 粒 子 的 多 样 性 ， 构 造 出 新 的 种 群 ; 


阶段 ， 
克隆 
克隆 


抗体 进 


免疫 克隆 选择 机 制 具体 步 又 如 下 : 


(1) 粒子 亲 和 度 计算 
的 GSA 算法 中 , 将 粒子 视 为 抗体 , 因此 本 文 将 粒子 


在 改进 
的 适应 度 函 


数 定义 为 粒子 的 亲 和 度 函数 ， 定 义 如 下 : 


使 得 种 群 朝向 更 优 解 移动 。 
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afit (1) = fit, (1) (18) 
记 (D 表示 粒子 i 在 迭代 1 时 的 适应 度 值 ，i=1,2,…,N 
(2) 克隆 复制 
选择 当代 种 群 中 亲 和 度 值 最 高 的 粒子 ， 进 行 位 置信 息 克 隆 
复制 操作 ， 复 制 个 数 为 M ， 文 中 选取 M =10 。 
(3) 克隆 变异 
对 经 过 克隆 复制 产生 的 新 粒子 进行 位 置 变异 ， 文 中 引入 基 


其 中 : 


于 高 斯 分 布 和 柯 西 分 布 的 突变 算 子 ， 其 概率 密度 函数 描述 分 别 
如 下 : 
f 0 a | (19) 
pp 20 
大 CD= (20) 


xp 十 (X 一 和 
通过 分 析 可 知 , 算法 在 迭代 前 期 , 应 保持 较 大 的 变异 步 长 ， 
以 扩大 算法 的 全 局 寻 优 范围 ， 在 迭代 后 期 ， 种 群 将 逐渐 聚集 于 
全 局 最 优 解 ， 变 异步 长 应 逐渐 减 小 ， 以 利于 算法 收敛 。 己 知 基 
于 柯 西 分 布 的 变异 算 子 相 比 于 高 斯 变异 有 具有 更 大 的 变异 尺度 ， 
适用 于 算法 前 期 进化 变异 ; 基于 高 斯 分 布 的 变异 算 子 适用 于 算 
法 的 后 续 兴 代 ,使 得 算法 能 够 更 快 地 收敛 。 因 此 ， 受 文献 错误 ! 
未 找到 引用 源 。 对 于 GSA 算法 进行 混合 变异 处 理 的 启发 ， 提 
出 一 种 改进 的 随 迭 代 次 数 自 适 应 调整 的 变异 策略 ， 定 义 如 下 : 


ss 


HT 


pe ee a 本 
X=X+Ax be NOD+Q- 方 ) con| (21) 


其 中 : * 表 示 克 隆 复制 所 得 粒子 位 置 x 表示 相应 粒子 变 
异 后 的 新 位 置信 息 ; 4 为 调节 系数 ,文中 取 4=0.1; 上 表示 算法 
当前 迭代 次 数 ，7 表示 算法 最 大 迭代 次 数 ，N(0,D 和 C(0,D 分 
别 表示 服从 高 斯 分 布 与 柯 西 分 布 的 随机 数 。 

(4) 克隆 选择 

经 克隆 变异 之 后 的 变异 粒子 和 原始 粒子 组 成 新 的 粒子 种 
群 ， 表 示 为 之 =[x,z] 。 对 于 新 种 群 之 ， 根 据 粒子 的 位 置信 息 分 
别 计算 其 的 亲 和 度 值 ， 并 从 中 选取 最 优 个 体 进入 下 一 次 迭代 ， 
实现 种 群 压缩 的 同时 ， 保 证 解 的 质量 。 


3 ”基于 改进 GSA 算法 的 K-means 算法 


针对 K-means 算法 易 受 聚 类 中 心 而 陷入 局 部 最 优 解 的 问 


a 
信 /区 


题 ， 本 文 利用 改进 引力 搜索 算法 优化 聚 类 中 心 ， 且 通过 调整 聚 
类 数 的 取 值得 到 不 同 聚 类 结果 , 提出 了 一 种 基于 改进 GSA 算法 


的 K-means 算法 ， 即 A2F-GSA-Kmeans 。 

引力 搜索 算法 是 通过 随机 方式 寻 优 不 受 初始 解 的 影响 ， 
此 , 本 文 首先 为 克服 GSA 算法 易 陷入 局 部 最 优 解 、 发 生 早熟 收 
敛 现象 等 问题 ， 提 出 了 两 种 改进 策略 ; 然后 ， 将 全 局 搜索 能 力 
较 强 的 改进 GSA 算法 与 K-means 算法 进行 结合 来 优化 聚 类 中 
心 ， 提出 一 种 新 的 聚 类 算法 A2F-GSA-Kmeans 算法 ; 最 后 ， 通 
过 利用 聚 类 评价 函数 对 不 同 聚 类 结果 进行 评价 ， 从 而 获取 最 佳 

算法 的 具体 步骤 如 下 : 


GhinaX iy 盒 作 期 刊 
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al) 初始 化 参数 。 其 中 包括 种 群 规 模 w ， 算 法 最 大 友 代 次 数 
7 ， 随 机 初始 化 粒子 群体 位 置 X,， 引 力 常量 6,， 引 力 系 数 衰减 
因子 “中 各 个 参数 ， 最 优 粒子 复制 数 W 。 

b) 令 算法 最 初 的 聚 类 数 上 =2 ， 且 的 取 值 范围 为 [2,6]， 


其 中 心 s < 。 
c) 按 照 当 前 指定 聚 类 数 对 数据 集 进 行 聚 类 ， 完 成 个 体位 置 


E&I 


初始 化 ， 计 算 适 应 度 值 并 选 出 当前 最 优 解 Gbest， 并 计算 相 
的 聚 类 有 效 性 指标 。 
d) 根 据 式 (2) (3) 更 新 粒子 的 惯性 质量 M,(D 。 
e) 根 据 式 7) (14) 来 更 新 万 有 引力 系数 G(1) 。 
四 根据 式 (11) 计算 加 速度 a 
外 根据 式 〈12) (13) 更 新 粒子 的 速度 和 位 置 。 
b) 克 隆 复制 W 个 当前 种 群 最 优 粒子 ,根据 式 (21) 进行 变 


异 操作 ， 并 从 变异 新 种 群 中 选择 最 优 个 体 进 入 下 一 次 迭代 。 
判断 是 否 达到 最 大 迭代 次 数 ， 如 果 是 ， 则 执行 j)); 否则 ， 
跳 至 c)。 
) 令 k=k+1， 直 到 k>k,。， 转 到 Step3。 
IJ 通过 比较 指标 si 的 大 小 ， 来 寻找 最 佳 的 聚 类 数 。 
4 ”实验 结果 与 分 析 
本 文采 用 MATLAB R2015b 开发 环境 进行 仿真 实验 ， 并 在 


Windous7 操作 系统 的 计算 机 上 运行 ， 来 验证 改进 算法 的 有 效 
性 。 
4.1 改进 GSA 算法 性 能 分 析 

实验 中 ， 为 了 验证 本 文 提出 的 A2F-GSA 改进 算法 的 性 能 ， 
相关 算法 参数 设置 如 表 1 所 示 , 并 引入 12 个 基准 测试 函数 (如 
表 2 所 示 ) 进行 仿真 实验 ， 其 中 包括 : 连续 单 峰 函数 (Fi~F4) 、 
多 峰 高 维 函 数 (Fs~Fg) 和 多 峰 低 维 函 数 (Fo~F1i2) 。 

表 1 算法 参数 设置 


参数 描述 GSA GG-GSA A2F-GSA 
N 种 群 规模 50 50 50 
了 最 大 友 代 次 数 1000 1000 1000 
Go 引力 常量 初始 值 100 100 100 
CQ 引力 系数 衰减 因子 20 30 本 
舱 =2-1.9(1/7) 
i 学 习 因 子 一 = 


GG=t/T 


表 3 展示 了 GSA 算法 错误 ! 未 找到 引用 源 。 、GG-GSA 算法 全 mL 林 想到 引用 
志和 A2F-GSA 算法 运行 30 次 之 后 获得 的 基准 测试 函数 值 的 平 
均值 、 最 小 值 和 标准 差 。 图 3 展示 了 维度 为 30 时 ，GSA 算法 
与 A2F-GSA 算法 优化 基准 测试 函数 时 收敛 过 程 对 比 图 。 图 4 
为 混合 维度 下 ，GSA 算法 与 A2F-GSA 算法 优化 基准 测试 函数 
时 收敛 过 程 对 比 图 。 


表 2 基准 测试 函数 


We pe 维 理论 
函数 名 表达 式 度 范围 最 优 
Dim 
Schwefel 1.2 R(X)= > 好 30 [-100,100] 0 
i=1 
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Dn Di Fu Mean -1.029E + 01 -1.054E + 01 -1.054E + 01 
Schwefel 2.22 EX)= > x+ 工 [xs| 30 [10,10] 0 
人 Best -1.054E + 01 -1.054E + 01 -1.054E + 01 
Schwefel 2.21 F(X)=max{| sb1sigD)} 30 [100,100] 0 Std.Dev 1.323E + 00 9.034E - 15 1.546E - 15 
2 
Step R= Ys +0.5|) 30 [-100,100] 0 从 表 3 可 以 看 出 , 在 12 个 基准 测试 函数 中 , 针对 单 峰 函数 
aoo--aen| 02 se | 的 优化 求解 ，A2F-GSA 算法 对 于 函数 Fi-F 的 收敛 精度 均 明显 
Ackley 30 [-32,32] 0 
-oo 高 ;Seos(2rs) jr20+e 优 于 其 他 算法 ， 而 对 于 步 进 函 数 Fy， 经 典 GSA 及 其 改进 算法 
Griewank R00 -全 (和 30 [600,600] 0 均 可 取得 其 理论 最 优 解 ， 且 由 图 3(a)~(c) 可 知 ， 收 敛 速度 相对 
Fo0- (nr) 于 经 典 的 GSA 算法 显著 提高 ,表明 本 文 提出 的 自 适 应 引力 系数 
Dim 
+ 全 人 G1) [lrsin’ (3xy, +1)] 衰减 方法 能 够 有 效 平衡 算法 的 全 局 探索 能 力 和 局 部 开发 能 力 ， 
Penalized 30 [-50,50] 0 入 人 二 日 二 二 、 i EN > 
-0 及 从 而 有 效 提升 算法 的 求解 效果 与 效率 。 
+,10100. 1 红 Se 一 一 
R(X)=0.1{sin’ (3zx )+ 是 
$F -1) [1+sin’ (3zx +D]+ 注 " 全 
Generalized i=l 30 [-50,50] 0 起 oa 所 
Penalized 1) [L 十 nz (3zxow 1 > i 9 05 
+> u(%,5,100,4) 
1 人 100 200 30 #00 500 600 700 B00 900 1000 WW 10 200 300 400 500 B00 700 a00 900 1000 
要 和 迭代 次 数 和 迭代 次 数 
Shekel F(X)= i 2 Ee 1 (3) 函 数 五 (b) 函 数 瑟 
500 气 ， 本 .536] 
j+2 (0) 要 函数 F3 函数 F5 
癌 ! 0: r 
Fa) = [+ totD) (19 -14 +38 Em 电 
Goldstein-Pri -14x +6x0 +38)]x*[30+(2% -30) 2 [22] 3 冯 
ce 室 如 
x(18-32% +12x7 +48x, -36xm+27 旺 )] 4 
Hartman FO0)= Dexp[- Da, 0 -py)] 3 [0,1] 3.86 所 * 条 
Family F200=-P [Co)eo) +o] 4 Wo Se 迁 代 次 数 和 挝 代 次 数 
表 3 ”A2F-GSA 与 其 他 算法 优化 基准 函数 对 比 (0) 函数 (由) 函数 FF 
GSA 镍 误 ! 禾 找到 可 GG-GSA 镭 误 ! 秒 我 到 村 函数 F7 函数 F8 
函数 用 源 。 引用 源 。 A2F-GSA 区 S| 2 让 和 
a a -esa 
2 2 
Fi Mean 2.244E -17 5.417E -23 7.032E - 32 Eo 
Best 1.130E - 17 2.896E - 25 5.257E - 32 号。 站 
Std.Dev 6.862E - 18 2.201E - 22 3.017E - 32 Fp 当 
到 Mean 2.289E - 08 1.260E - 10 1.442E - 15 | ee” 
Best 1.802E - 08 3.510E - 12 1.282E - 15 迭代 次 数 送 代 次 数 l 
Std.Dev 2.658E - 09 2.337E - 10 1.643E - 16 Ce) 函数 F7 (函数 Fs 
Fs Mr 3.567E - 02 1.741E - 09 3.443E - 15 
3 an 图 3 A2F-GSA 与 GSA 优化 基准 测试 函数 《维度 为 30) 收敛 曲 线 
Best 2.488E - 09 1.232E - 10 9.360E - 16 
SidDev 1318E-01 1.877E - 09 3.004E - 15 = 二 
所 Mean 0.000E + 00 0.000E + 00 0.000E + 00 天 Ce 过 ra 
室 
Best 0.000E + 00 0.000E + 00 0.000E + 00 去 加 
SidDev 0.000E+00 0.000E + 00 0.000E + 00 EE ” 人 
Fs Mean 3.597E - 09 2.703E - 12 1.013E - 14 和 zl 
Best 2.407E - 09 4.343E - 13 7.994E - 15 -| FE “人 
Std.Dev 6.866E - 10 3.218E - 12 1.946E - 15 人 CR 
Fs Mean 4.343E + 00 1.170E + 00 4.045E - 02 (a) 函 数 Fio (b) 函 数 Fi 
Best 1.985E + 00 3.946E - 02 0.000E + 00 图 4A2F.GSA 与 GSA 优化 基准 测试 函数 (混合 维度 ) 收 伍 曲 线 
Std.Dev 1.735E + 00 8.023E - 01 4.322E - 02 
万 Mean 2.015E - 02 3.455E - 02 1.041E - 02 针对 具有 多 个 局 部 极 值 的 多 峰 函 数 的 优化 求解 ， 从 表 3 和 
Best 7.913E - 20 1.277E - 27 1.571E - 32 he 
图 3(d)~(f) 可 知 ,在 维度 为 30 的 测试 条 件 下 ，A2F-GSA 算法 对 
Std.Dev 4.799E - 02 9.940E - 02 3.162E - 02 
Fs Mean 1.590E - 03 7.325E - 04 3.663E - 04 于 函数 Fs-Fs 的 优化 精度 与 速度 显著 优 于 其 他 算法 ， 表 明 将 免 
Best 1.297E - 18 2.838E - 26 1.350E - 32 疫 克 隆 选择 机 制 引入 A2F-GSA 算法 中 ， 能 够 使 得 算法 有 效 跳 
Std.Dev 5.395E - 03 2.788E - 03 2.006E - 03 
Ey 恒 . 作 十 音 局 人 Fe 一 一 rr 
Fo Mean 3.726E + 00 2.241E + 00 2.247E + 00 出 局 部 最 优 ， 改 善 算法 早熟 收敛 现象 。 而 在 混合 维度 下 ， 函 数 
Best 9.980E - 01 9.980E - 01 9.980E - 01 Fo-F1i2 相 比 于 高 维 多 峰 函数 具有 较 少 的 局 部 极 值 点 ， 由 表 3 和 
Std.Dev 2.726E + 00 9.922E - 01 1.327E + 00 
注 对 于 和 作 修 专人 解 
Fio Mean 3.000E + 00 3.000E + 00 3.000E + 00 图 4(a)(b) 可 知 ，A2F-GSA 算法 对 于 Fl11、Fi2、F1is 的 优化 求解 
Be 3000E+00 ~ 3.000E+00 3.000E+00 均 取得 相应 的 理论 最 优 解 ， 且 标准 差 值 均 低 于 其 他 算法 ， 只 是 
Std.Dev 4.807E - 15 2.566E - 15 5.470E - 16 
了 削 数 Fo 的 优化 效用 人 少 于 -GSA 和 算法， 但 经 典 
Fu Mean -3.863E + 00 -3.863E + 00 -3.863E + 00 于 函数 古 的 优化 效果 略 筋 于 GG-GSA 算法 ， 但 相 比 于 经 
Best -3.863E + 00 -3.863E + 00 -3.863E + 00 GSA 算法 仍 有 显著 提高 。 
Std.Dev 2.710E - 15 2.710E - 15 2.220E - 16 
加 综 上 所 述 , 对 于 文中 选取 的 12 个 基准 测试 函数 , 本文 提 出 


a 


的 A2F-GSA 算法 具有 最 优 的 求解 精度 、 收 敛 速度 和 重 棒 性 。 收敛 性 能 。 然 后 结合 A2F-GSA 算法 和 K-means 算法 提出 一 种 
4.2 改进 聚 类 算法 性 能 分 析 新 的 A2F-GSA-Kmeans 聚 类 算法 .并 在 6 个 UCI 测试 数据 集 上 

为 了 验证 本 文 提 出 的 基于 改进 的 引力 搜索 算法 的 K-means 进行 实验 表明 ， 相 比 于 基于 经 典 GSA 和 改进 蜂 群 算法 
算法 的 有 效 性 ， 从 而 寻找 最 佳 聚 类 数 ， 本 文采 用 公开 测试 数据 。 KK-means 算法 ， 本 文 提出 的 A2F-GSA-Kmeans 算法 的 聚 类 质量 


大 UJCI 鲁 识 ! 未 找到 引用 源 。 库 中 的 数据 集 Normal07、Cancer、 Iris、Wine、 有 明显 提高 。 
Glass、Abalone 进行 实验 仿真 。 且 数据 集 的 特征 分 布 如 表 4 所 


bm 
人 


中 
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算法 中 的 参数 设置 采用 A2F-GSA 算法 的 基本 参数 设置 ， 
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